نظریه ریاضی جهل
مترجم: محمد دانش
آن چیز که مایه آزار شخص عمل گرا و عمل پسند است تعداد بی شمار چیزها و رویدادهایی است که بی وقفه از مقابل چشم های او می گذرند و او نمی تواند جریان آن ها را فرا چنگ آورد. آنچه او لازم دارد به چنگ آوردن تمام این اعداد بزرگ و بسیار است.
تئودور مرتس
یکی از قاعده های نسبتاً خوب در بازی بریج، وقتی که ورق های دست بازیگر ضعیف است، این است که از ضعیف ترین خال ها شروع کنیم. در داستان ما هم این قاعده برای « دست ها»ی علمی خوب به کار می آید. این قاعده را دانشمندان علوم اجتماعی وقتی به کار بردند که فهمیدند که برگ های برنده در دست ندارند، و توفیق چشمگیری هم به دست آوردند.
تاکتیک های ریاضی دانان موفق و دانشمندان موفق علوم فیزیکی را می توان در یک کلام « پیشینی» [مستقل از تجربه] و استنتاجی- قیاسی دانست. آنان با تأمل دقیق در مورد هر قسمی از شناخت یا معرفت از هر نوع پدیده ای، اصولی بنیادی می یابند که در واقع در حکم اصول موضوعه [ یا اکسویم ها] هستند. در نتیجه، استدلال استنتاجی شناخت و نتایج جدیدی به دست می دهد. در این رهیافت نظری محض، مشاهده و تجربه نیز به یافت اصول اولیه یا آزمودن استنتاج ها کمک می کنند، اما عامل اصلی و تعیین کننده ذهن است و نه حواس پنجگانه
رهیافت استنتاجی و « پیشینی»، در مجموع، آن قدر قوی و کارآمد نیست که به دانشمندان علوم اجتماعی اجازه دهد معتبرترین و دقیق ترین نتایج خود را به دست آورند. شاید دلیل اصلی این شکست آن باشد که پدیده های مورد مطالعه این دانشمندان بسیار پیچیده است. حتی در مسائل نسبتاً محدود، عوامل تعیین کننده دخیل آن قدر زیاد است که تفکیک عناصر اصلی ممکن نیست. مثلاً چگونه می توان خوشبختی و سعادت یک ملت را توجیه کرد؟ چنین موقعیت خرسند کننده ای به منابع طبیعی، عرضه نیروی کار، سرمایه موجود، تجارت خارجی، جنگ و صلح، امکانات روان شناختی، و بسیاری متغیرهای دیگر بستگی دارد. پس عجیب نیست که کسی عامل اصلی را در نیابد. اگر اقتصاددانی بکوشد با مفروضاتی در باب برخی از این متغیرهای دخیل مسئله را ساده کند، احتمالاً مسئله چنان شکل مصنوعی به خود خواهد گرفت که دیگر هیچ گونه ارتباطی به وضعیت ذاتی و اصلی نخواهد داشت.
در بسیاری از موارد هنوز رهیافت به « پیشینی» استنتاجی- قیاسی میسر نیست؛ چرا که عملاً هیچ معرفتی که بتوان با آن کار کرد، در کار نیست. درمان برخی از بیماری ها را نمی توان رسماً تجویز کرد، زیرا اطلاعی از علل آن وجود ندارد. قلمروهای وسیعی از شیمی بدن و فعالیت مغز برای زیست شناسان همچنان کاملاً مرموز است. عملکرد وراثت فیزیکی تقریباً به کتابی مهرو موم شده می ماند.
در بعضی از مسائل، ناتوانی در به دست آوردن قوانین بنیادی از طریق روش کلاسیک استنتاج از اصول موضوعه به دلیل اطلاعات بسیار زیاد است؛ و این وضع به نظر کاملاً پارادوکسیکال می آید. گاز از ملکول هایی تشکیل شده است که یکدیگر را بر اساس نیروی کاملاً آشنا و معروف گرانش جذب می کنند. به علاوه، این ملکول ها بنابر قوانین نیوتنی حرکت می کنند. اگر حجم معینی از گاز تنها از دو سه ملکول تشکیل شده بود، دانشمندانی می توانستند عملکرد آن گاز را به همان دقتی که عملکرد سیاره ها را پیش بینی کردند، پیش بینی کنند.
اما یک سانتی متر مکعب از گار در شرایط معمولی از
دلیل دیگری که برای توضیح ناکارآمدی رهیافت « پیشینی» و استنتاجی به مسائل اجتماعی داریم به قرن نوزدهم بر می گردد. انقلاب صنعتی سبب تولیدات کلان کارخانه ای و افزایش جمعیت شهری شد. از دل این پیشرفت ها، مجموعه گسترده ای از مسائل اجتماعی به وجود آمد؛ مسائلی که با تغییرات جمعیت، بیکاری، تولید کمی و مصرف کمی کالاها، بیمه و انتشار بیماری بر اثر عدم وجود امکانات بهداشتی- زیستی در نواحی ای با جمعیت انبوه در ارتباط بود. این مسائل چنان به سرعت بر سر پژوهندگان علمی آن بارید که حتی اگر این پژوهشگران توانایی حل آن ها را با روال استنتاجی « پیشینی» می داشتند، نیاز به زمانی بسیار زیاد داشتند؛ آن قدر زیاد که حتی شاید دیگر نمی توانستند از خطرات آن مشکلات جان سالم به در برند. این روش، حتی وقتی که از طرف نوابغی چون کوپرنیک، کپلر، گالیله و نیوتن به کار برده شد، عملاً به بیش از یک صد سال تلاش نیاز داشت تا قوانین حرکت و گرانش را پدید آورند. بعید است که در زمینه های پزشکی و اجتماعی، نتایج سریع تر از این حاصل شود.
به هر حال، به تمام این دلایلی که ذکر کردیم، رهیافت « پیشینی» استنتاجی، دانشمندان علوم اجتماعی را یاری نکرد، و، از این رو، لازم بود تا روش دیگری برای بررسی مسائل اجتماعی به دست آورند. اگر کسی به لزوم بسیار زیاد این روش جدید (برای به دست آوردن قوانین علمی) دیگر فکر کند، چه بسا از یافتن این روش برای همیشه مأیوس شود. این روش می بایست به سرعت نتایج تازه ای در اختیارمان گذارد؛ می بایست آثار متغیرهای بسیاری را که در یک وضعیت عمل می کنند جمع بندی کند؛ می بایست در مواردی که هیچ فهمی از مسئله وجود نداشت با موفقیت مسئله را روشن و تبیین کند؛ می بایست آثار و معلول های میلیون ها عامل دخیل در یک پدیده را به یک علت برگرداند؛ و می بایست تأثیر عواملی را که خود قابل اندازه گیری نبودند اندازه بگیرد. با وجود این همه تقاضا، روش جدیدی برای برخورد با مسائل علمی ایجاد شد که همیشه این تقاضاها را برآورده کرد.
این رهیافت جدید با تحلیل وضعیت موجود امور آغاز شد. دانشمندان علوم اجتماعی نشان دادند که پدیده هایی داریم که ماهیت ذاتی آن ها را در نمی یابیم، یا وقتی که آن را دریافتیم، مانند حرکت ملکول های گاز، این دریافت چندان فایده ای برای ما ندارد. بنابر این، ما مجهز به اصول بنیادی ای نیستیم که بتوانند اساس و پایه رهیافت استنتاجی قرار گیرند. از جنبه دیگری هم ناتوان به نظر می رسیم؛ هزاران پدیده نظم ناپذیر و دشوار بر سر ما آوار شده و جهل و بی خبری مان را مدام به روی ما می آورند.
در این مرحله بود که دانشمندان علوم اجتماعی قواعد بازی بریج را به یاد آوردند. از آن جا که آنان اصولی بنیادی در اختیار نداشتند که برگ برنده آن ها باشد، تصمیم گرفتند که از ضعیف ترین خال ها شروع کنند. به عبارت دیگر، آن ها می گفتند که اگر نمی توانیم بفهمیم باران « چگونه» بر پوشش های گیاهی اثر می گذارد، «باید» کاری را که می کند « اندازه بگیریم». اگر نمی دانیم که « چرا» مایه کوبی (واکسیناسیون) مانع مرگ می شود، لااقل نتایج این عمل را « در جدول هایی دسته بندی کنیم». اگر نمی توانیم به «عمق دلایل» پیشرفت یک کشور «برسیم»، دست کم شاخص مناسب تعیین کنیم و صعود و نزول این شاخص را « ترسیم» کنیم. اگر مکانیسم وراثت در گیاهان و حیوانات و انسان را « نمی فهمیم»، بهتر است به تولید گونه ها بپردازیم و آنچه در نسل های بعدی آشکار می شود« ثبت کنیم». بگذاریم دنیا آزمایشگاه ما باشد و از آنچه در آن اتفاق می افتد آمارهایی تهیه کنیم.
فکر جمع آوری آمار فکر تازه ای نبود؛ در « کتاب مقدس» و در اسناد قدیمی نیز می توان آمارهایی پیدا کرد. آنچه تازه بود درکی از آمار بود که بر مبنای آن آمار می تواند سلاح نیرومندی در برخورد با مسائل علوم اجتماعی باشد؛ این ایده گویا نخستین بار به ذهن خراز انگلیسی ثروتمندی به نام جان گرنت (1) رسید (گرنت در قرن هفدهم زندگی می کرد). تنوع و سرگرمی گرنت این بود که گزارش علت های مرگ را در شهرهای انگلستان مطالعه می کرد. به مرور متوجه شد که درد مرگ و میر بر اثر تصادف ها، خودکشی و بیماری های مختلف اصولاً تغییر نمی کند. بدین ترتیب، به نظر می رسید چنین وقایعی که ظاهراً یکسره به بخت و اقبال افراد بستگی دارند، نظمی شگفت را نشان می دهند. به علاوه، گرنت متوجه شد که تعداد موالید پسر بیش از موالید دختر است. بر اساس این آمار گرنت چنین استدلال کرد: از آن جا که مردان بیش از زنان در معرض خطرات شغلی اند و نیز بیش از زنان از جنگ آسیب می بینند، تعداد مردان مستعد ازدواج تقریباً برابر تعداد زنان می شود و، از همین رو شکل طبیعی ازدواج باید تک همسری باشد.
کار گرنت را دوست او، سر ویلیام پتی (2)، که استاد کالبد شکافی و موسیقی بود و بعدها هم پزشک ارتش شد، ادامه داد. هر چند پتی نظیر گرنت مشاهدات برجسته ای انجام نداد، به خصوص به دلیل گستره دیدگاهش شایسته یادآوری است. او اصرار داشت که علوم اجتماعی باید همچون علوم فیزیکی کمی باشند. پتی در مورد نوشته های خود در زمینه های پزشکی، اقتصاد، ریاضیات و سیاست گفته است که « روشی که مورد استفاده من است هنوز خیلی جاافتاده نیست، زیرا من به جای آن که از کلمات مبین قیاس های نسبی و عالی و استدلال های ذهنی استفاده کنم، این رویه را پیش گرفته ام... که مقاصد خود را بر حسب عدد، وزن، و مقیاس های اندازه گیری عینی بیان کنم؛ تنها از استدلال هایی استفاده کنم که حواس آن ها را در می یابد، یعنی تنها به مواردی توجه کنم که گویی شالوده هایی مرئی در طبیعت دارند.» او علم آمار را که هنوز مراحل طفولیت خود را طی می کرد « حساب سیاسی» نام داد و آن را چنین تعریف کرد: « فن استدلال کردن با ارقامی که به امور حکومت دلالت داشت.» در واقع، او تمام اقتصاد سیاسی را شاخه ای از آمار به شمار می آورد.
وقتی این انگلیسی های هشیار و دوراندیش از امکانات بالقوه آمار سخن گفتند و نیز وقتی کشیشی از قرن هفدهم از آمار سود جست تا این خرافه را که اهله قمر بر سلامتی تأثیر می گذارد به دور اندازد، نطفه علم جدیدی منعقد شد. این دوره کارهای مقدماتی حدود یک صد سال به طول انجامید. در این مدت علم آمار به جایی رسید که می توانست اطلاعات کمی قابل توجهی را به صورتی کاملاً کلی در مورد یک کشور در بر داشته باشد؛ یعنی دیگر می شد آمار را « داده» سیاستمداران دانست. تا اوایل قرن نوزدهم، به پیشنهادهای پتی و گرنت، یعنی به دست آوردن این قانون ها بر اساس داده های موجود، توجه چندانی نشد. در سال های اول قرن بیستم، گروه فعال و تأثیر گذاری از پژوهشگران- که هم از ناکارآمدی رهیافت « پیشینیِ» استنتاجی در علوم اجتماعی آگاه بودند و هم از توانایی های بالقوه آمار- کمر به حل اساسی ترین مشکلات بستند.
پتی و گرنت کاشفان مسیر فکری جدیدی بودند، اما برای به دست آوردن طلای خالص تنها استخراج سنگ معدن کافی نیست؛ هر چند این هم خود کار بسیار مشکلی است. کان سنگ را باید الک کرد، تصیفه کرد و از ناخالصی ها پالود. بر همین مقیاس، صرف انباشت آمار، به خودی خود، چندان کار ساز نیست. زیرا از این داده ها تنها ساده ترین مسائل را می توان به سهولت نتیجه گرفت. بیرون کشیدن دانش از میلیون ها میلیون داده به کمک ریاضیات میسر است.
تقریباً ساده ترین شیوه ریاضی برای کسب دانش و معرفت تازه از دل داده های بسیار یافتن میانگین است. مثلاً فرض کنید دستمزد روزانه کسانی که در یک سازمان تجاری کوچک کار می کنند، بر حسب دلار از این قرار باشد:
2000، 1000، 100، 90، 80، 70، 60، 50، 50، 50، 40، 30، 20
میانگین دستمزد روزانه چقدر است؟ برای یافتن میانگین معمولاً حاصل جمع دستمزدها را پیدا و بعد نتیجه را بر تعداد تقسیم می کنیم. در این مثال، حاصل جمع 3640 و تعداد مزد بگیران 13 نفر است، پس میانگین دستمزد 280 است. این گونه میانگین را « میانگین حسابی« (3) می نامیم.
واضح است که میانگین اطلاعات زیادی در بر ندارد. در واقع، دستمزد هیچ یک از این سیزده نفر برابر میانگین حاصل نیست: از این گذشته، در میان این جمع سیزده نفری تنها دو نفر بیش از حد میانگین دریافت می کنند و دستمزد بقیه بسیار کمتر است. به عبارت دیگر، اگر برخی مؤلفه های کمی در قیاس با برخی دیگر خیلی بزرگ باشند، میانگین حسابی عددی نیست که گویای چیز خاصی باشد. در این موارد، دیگر انواع میانگین ها اطلاعات بیشتری به دست می دهند. نوع دیگری از میانگین، یعنی «میانه» (4)، که بسیار هم کاربرد دارد، داده ای است که تعداد موارد ماقبل و مابعد آن برابر است. در مثال ما، سیزده نفر مزدبگیر وجود دارد و دستمزد میانه 60 دلار است، زیرا شش نفر بیش از این مقدار و شش نفر دیگر کمتر از آن مزد می گیرند.
در این مثال، به نظر می آید که میانه عددی شاخص تر باشد، اما این عدد نیز همه چیز را نمی گوید. اگر حقوق شش نفری که کمتر از حد میانه دریافت می کنند خیلی کمتر از میانه باشد و دستمزد شش نفری که بیش از این مقدار دریافت می کنند خیلی بیشتر از آن باشد، اطلاعات میانه چندان فرقی با میانگین نخواهد داشت. تفاوت شدیدتری که در دستمزدها وجود دارد در میانه 60 دلار خود را نشان نمی دهد؛ پس، میانه نیز نمی تواند عدد شاخصی باشد.
میانگین دیگری که استفاده بسیار زیادی دارد «مد» یا « نما» (5) است ؛ عددی که بیش از سایر اعداد در مجموعه داده ها وجود دارد. در مثال ما، مد دستمزدها 50 است، زیرا بیشترین تعداد 50 دلار دستمزد می گیرند. هر چند مد نیز، همچون دیگر میانگین ها، چیزهایی درباره نحوه توزیع حقوق ها می گوید، آن نیز کافی نیست. طیف دستمزدهای بالا و پایین مد در این میانگین منعکس نمی شود.
آنچه هیچ کدام از این میانگین ها نمی تواند به ما بگوید نحوه توزیع داده ها در بالا و پایین میانگین مورد نظر است. میانگین حسابی به تمامی مقدارهای موجود بستگی دارد، اما نمی توانیم ماهیت چگونگی توزیع مقدارها را از آن استنباط کنیم. مثلاً، اگر دو دستمزد 1000 و 2000 دلاری به دستمزدهایی 100 و 2900 دلاری تغییر کنند، میانگین تفاوتی نخواهد کرد؛ در حالی که ماهیت چگونگی توزیع دستمزدها تغییر کرده است. آنچه بدان نیاز داریم سنجه ای است که پراکندگی داده ها را در حدود میانگین نشان دهدو به این منظور، آمار دانان از کمیتی استفاده می کنند که آن را « انحراف معیار»(6) می نامند و با علامت ( ) نشانش می دهند. این کمیت را چنین محاسبه می کنند : نخست، تفاوت بین هر داده و میانگین حسابی را، یعنی انحراف آن داده ها را از این نوع میانگین، محاسبه می کنند. برای آن که به اعداد منفی برخورد نکنند، این انحراف از میانگین را مجذور می کنند. سپس با جمع کردن این مجذور انحراف ها و تقسیم آن ها به تعداد داده ها، میانگین آن ها را حساب می کنند. جذر این میانگین اخیر را به دست می آورند تا آن که تأثیر عمل جذری که پیش تر انجام شده بود تا حدی حذف شود. یک کلام، انحراف معیار یک مجموعه از داده ها عبارت است از جذر میانگین مجذور هر تک انحراف از میانگین حسابی آن داده ها.
می توانیم برای روش شدن نحوه محاسبه انحراف معیار، همان مجموعه دستمزدها را در نظر بگیریم؛ اما برای آن که بی جهت به دام محاسباتی پردرد سر نیفتیم، داده هایمان را ساده تر در نظر می گیریم:
18، 13، 10، 7، 4، 3، 1
میانگین این دانسته ها 8 است. پس انحراف تک تک آن ها از میانگین به قرار زیر خواهد بود:
10، 5، 2، 1، 4، 5، 7
مجذور این انحراف ها، از این قرار است:
100، 25، 4، 1، 16، 25، 49
که حاصل جمع آن ها 220 و میانگین آن ها 7/220 است (که تقریباً می شود 4/31).
جذر این میانگین 6/5 است. چون این عدد در قیاس با میانگین حسابی داده ها، یعنی 8، بزرگ است، پراکندگی داده ها نیز باید زیاد باشد. اگر همین محاسبات را در مورد داه های مربوط به مثال دستمزد انجام بدهیم، انحراف معیاری برابر 556 به دست می آوریم؛ و به یاد دارید که میانگین حسابی در آن مثال 280 بود. باز هم می توانیم حکم کنیم که توزیع دستمزدها نسبت به میانگین باید بسیار زیاد باشد.
البته، با این که هم عدد میانگین حسابی و هم انحراف معیار نمی توانند به اندازه داده ها اطلاعات به ما بدهند، چون ذهن نمی تواند همه داده ها را در خود جای دهد و با آن ها کار کند، این اعدادی بسیار مفیدند.
به جای از برکردن کل داده ها یا اتکای مطلق به آن دو عدد، راه دیگری هم پیش رو داریم؛ و آن این که از نمودار استفاده کنیم. به ندرت می توان کسی را یافت که هر روز روزنامه می خواند، ولی با نموداری از داده ها برخورد نکرده باشد. نمودارهای صعود و نزول هزینه زندگی و مواد غذایی از جمله مثال های آشنا در این مورد هستند. هر چند روش نمایش نموداری داده ها نتایجی عمیق تر و مهم تر از صرف نمایش صعود و نزول داشته است.
فرض کنید در جامعه ای قد همه افراد را انداره گیری کرده ایم. در مقایل هر طول قد، فراوانی آن را هم داریم. اگر طول قد افراد را بر محور طول ها و فراوانی وقوع آن ها را بر محور عرض ها بنگاریم، منحنی توزیع این فراوانی ها را به دست می آوریم. در شکل 1 نموداری از داده های موجود نشان داده شده که به صورت منحنی نرمی ترسیم شده است. تردیدی نیست که این نمودار تصویری ارائه می کند که ذهن به سهولت آن را در می یابد و مقدار زیادی از اطلاعاتی را که در داده های اصلی وجود دارد به یک باره جلوه گر می سازد.
در مورد نحوه توزیع طول قد افراد جامعه و نیز بسیاری دیگر از ویژگی ها، آنچه به خصوص اهمیت دارد این است که چنین منحنی ای به توزیع ایده آل (آرمانی) که ریاضی دان آن را با نام «منحنی فراوانی نرمال» (7) می شناسد (شکل 2)، نزدیک است. درواقع، هر چه گروه افرادی که قد آن ها اندازه گیری شده بزرگ تر باشد، این منحنی به شکل ایده آل خود نزدیک تر می شود؛ درست همان طور که هر چه تعداد گوشه های چند وجهی منتظم بیشتر باشد، به دایره نزدیک تر می شود.
منحنی فراوانی نرمال یا توزیع نرمال آن چنان رایج و مهم است که باید به مشخصه های اساسی آن توجه کنیم. این منحنی نسبت به خط قائمی که نماینده بیشترین فراوانی در میان داده هاست متقارن است. وقتی به این منحنی در سمت راست یا چپ این خط توجه کنیم، می بینیم که ابتدا به آرامی و سپس به تندی نزول می کند و سرانجام در یکی از این دو جهت به محور افقی نزدیک و نزدیک تر می شود، اما هرگز به آن نمی رسد. شکل این منحنی تا حدی شبیه ناقوس است و از همین رو آن را « منحنی ناقوسی»(8) [ یا زنگ دیس یا زنگوله ای شکل] نامیده اند.
در هر توزیع نرمال، طول آن نقطه ای که هم پاسخ با بزرگ ترین عرض یا فراوانی است، مد توزیع را نشان می دهد؛ زیرا سنجه کمیّتی است که بیش از همه کمیت های دیگر با آن مواجهیم. این مد همچنین حد میانه هم هست، زیرا تقارن منحنی حاکی از آن است که در سمت چپ طول نقطه مورد نظر به همان اندازه مورد وجود دارد که در سمت راست آن. همچنین تقریباً بدیهی است که این مد میانگین نیز هست، زیرا دو طول نقطه ای که هر یک بر یک طرف مُد واقع شده اند و به یک اندازه از مُد فاصله دارند، فراوانی برابری دارند و، در محاسبه میانگین، معدل تمامی این جفت نقطه های هم فاصله نقطه میانی خواهد بود. به این ترتیب، در یک توزیع نرمال مُد، میانه و میانگین با هم تطبیق می کنند.
منحنی فراوانی نرمال از حدود سال 1800 بدین سو برای منجمان و دیگر دانشمندان پدیده آشنایی بوده است، زیرا این منحنی در رابطه با اندازه گیری ها نقشی اساسی بازی می کند. فرض کنید دانشمندی می خواهد طول دقیق قطعه سیمی را بیابد. او طول این قطعه سیم را نه یک بار، که مثلاً پنجاه بار اندازه گیری می کند و این تا حدی به خاطر آن است که دست و چشم کاملاً دقیق نیستند و تا حدی هم به خاطر آن است که چه بسا شرایط محیط پیرامون، همچون دمای محیط، نوسان داشته باشد. این پنجاه دفعه اندازه گیری گاه به شکل محسوس و گاه به شکلی نامحسوس با هم تفاوت دارند. نموداری از اندازه گیری های مختلف در برابر تعداد دفعاتی که هر اندازه گیری در این پنجاه دفعه دیده می شود، تقریباً یک منحی فراوانی نرمال است. در واقع، هر چه تعداد اندازه گیری ها بیشتر باشد، توزیع فراوانی آن ها بیشتر به چنین منحنی ای نزدیک می شود.
برای دفاع از این ادعا دلیل محکمی در دست داریم. خطاهایی که در اندازه گیری رخ می دهد باید ناشی از خطاهای تصادفی چشم یا دست یا انحراف های طبیعی ابزار باشند. این خطاها باید در یکی از دو طرف مقدار واقعی توزیع و متمرکز شوند؛ درست همان طور که تیرهایی که یک تیرانداز، در صورت نشانه گیری درست، به طرف هدفی می اندازد، حول آماج برخورد کرده و با افزایش شمار تیر با فاصله ای کمتر از آماج به آن می خورد.
این واقعیت که اندازه گیری ها نمایانگر یک منحنی نرمال هستند کمک زیادی به دانشمندان کرده است. در یک توزیع نرمال، داده ها حول مقدار میانگین تمرکز پیدا می کنند که، مطابق با آنچه هم اکنون گفتیم، باید مقدار واقعی باشد. از این رو، مقدار میانگین شمار زیادی از اندازه گیری ها، اگر منحنی بهنجاری را بنمایاند، باید به اندازه واقعیت نزدیک و نزدیک شود.
از این گذشته، اگر مجموعه بزرگی از اندازه گیری ها منحنی نرمال را مشخص نکند، باید خطایی نگران کننده در روند اندازه گیری ها پیش آمده باشد که باید آن را حذف کرد. مثلاً، اگر طول یک قطعه فلز در اتاقی اندازه گیری شود که دمای آن در حال افزایش است، حاصل اندازه گیری بی تردید افزایش پیوسته ای را نشان خواهد داد که، در نهایت، منحنی نرمال ایجاد نمی کند. میانگین این اندازه گیری ها خطای آشکاری را نشان می دهد و طبیعتاً نمودار این اندازه گیری ها آن عامل مخل را به یک نگاه آشکار می کند.
از منحی نرمال در تعیین فاصله های نجومی، در اندازه گیری جرم و نیرو و سرعت، و نیز در تشخیص دقیق حلاّلیت، دمای جوش، دمای ذوب و صدها کمیت شیمیایی دیگر هزاران بار استفاده شده است. چون از منحنی نرمال در حذف خطاهای اندازه گیری هم استفاده می کنند، آن را با نام « منحنی خطا»(9) هم می شناسند. صرف وجود این منحنی این نتیجه به ظاهر پارادوکسیکال، ولی به هر حال درست، را تأیید می کند که خطاهای اندازه گیری همین طور تصادفی رخ نمی دهند، بلکه همیشه از چنین منحنی ای تبعیت می کنند. انسان به خواست و اراده خود حتی خطا هم نمی تواند بکند.
به هنگام استفاده از توزیع نرمال، مهم است که بدانیم، در طیف معینی از کمیّت های اندازه گیری شده، چه تعداد مورد وجود دارد. مثلاً طول قد 100000 نفر از ساکنان کشوری را در نظر بگیرید. قبلاً شرح دادیم که چگونه فراوانی قدهای مختلف بر منحنی نرمال می نشیند. فرض کنید میانگین این توزیع و انحراف معیار آن، به ترتیب، 5/167 سانتی متر و 5 سانتی متر باشد. به این ترتیب، در حالت ایده آل 2/68 درصد از قدهای اندازه گیری شده در طیف 1 درجه انحراف از معیار یا به فاصله 5 سانتی متر از میانگین قرار می گیرند؛ یعنی طول قد 2/68 درصد از افراد بین 5/162 و 5/172 سانتی متر است. علاوه بر این، 4/95 درصد از قدها در طیف 2 درجه انحراف از معیار یا به فاصله 10 سانتی متر از میانگین قرار می گیرند و 8/99 درصد از قدهای اندازه گیری شده 3 درجه انحراف از معیار یا 15 سانتی متر فاصله از میانگین را نشان می دهد. درصد تعداد افرادی که قد آن ها در طیف عددی کسری از انحراف معیار نسبت به میانگین واقع می شود نیز محاسبه شده است و می توان آن را در جدول ها یافت. بنابر این، اگر کسی به مطالعه توزیع نرمال بپردازد و میانگین و انحراف معیار را محاسبه کند، می تواند تمام اطلاعاتی را که در مورد نحوه توزیع می خواهد از این دو کمیت به دست آورد.
در سال 1833، لامبر آدولف ژاک کتله (10)، منجم و هواشناس و آماردان بلژیکی، تصمیم گرفت صفات و توانایی های انسانی را در پرتو منحنی فراوانی نرمال مورد مطاله قرار دهد. ضمناً بسیاری از داده های او بنابر هزاران اندازه گیری ای بود که هنرمندان عهد رنسانس، همچون آلبرتی، لئوناردو، گیبرتی (11)، دورر، و میکلانژ، از قسمت های مختلف بدن انسان انجام داده بودند. کتله نکته ای را دریافت که پس از او صدها نفر از اسلافش آن را تأیید کردند. کما بیش تمام ویژگی های ذهنی و فیزیکی انسان ها توزیع فراوانی نرمال را نشان می دهند. معلوم شد که قد، اندازه هر ساق دست و پا یا بازو و ران، اندازه سر، وزن مغز، هوش (بر حسب سنجش با تست های هوش)، حساسیت چشم به فرکانس های گوناگون بخش مرئی طیف موج های الکترومغناطیسی از توزیع نرمالی در چارچوب یک تیپ « نژادی» یا « ملی» برخوردارند. همین نکته در مور حیوانات، گیاهان و کانی ها نیز درست است. توزیع اندازه و وزن هر نوع از پرتقال یا طول کامل هر نوع از ذرت نرمال است.
از نظر کتله، مهم ترین نکته این است که صفات و توانایی های انسانی از همان منحنی توزیع نرمال تبعیت می کنند. که خطاهای اندازه گیری استدلال او در این خصوص این است که تمام انسان ها، همچون قرص های نان، از یک خمیره درست شده اند که تفاوت هایشان تنها به دلیل گوناگونی های تصادفی در روند آفرینش است. به همین دلیل است که قانونی برای خطاها برقرار است. هدف طبیعت انسان ایده آل است، اما همیشه به این نشانه نمی زند و، بنابر این، از هر دو سو انحراف هایی پیش می آید. از طرف دیگر، اگر هیچ نوعی وجود نداشته باشد که انسان ها را به آن تطبیق کنند، می توانیم مشخصات انسان ها را- مثلاً طول قد آن ها را- اندازه بگیریم بی آن که هیچ اهمیت خاصی در نمودار پیدا کنیم.
هر چه تعداد اندازه گیری های کتله بیشتر شد، بیشتر از درستی این نکته مطمئن شد که گوناگونی های فردی آرام آرام محو و شاخص های محوری و مشترک آدمی دقیق تر و دقیق تر می شوند. میانگین هر یکی از این مشخصه های « انسان میانگین» یا ایده آل را معین می کند. از این گذشته، انسان میانگین مرکز ثقلی است که جامعه حول او می چرخد. به این ترتیب، کتله اعلام کرد که سرشت های اصلی از علل عام ناشی می شوند و به همین دلیل جامعه وجود دارد و حفظ می شود. از این گذشته، نشانه وجود طرحی منظم و موجبیتی علّی (12) در پدیده های اجتماعی همان قدر واضح به نظر می رسد که در پدیده های فیزیکی.
کاربرد پذیری نمودار نرمال در مسائل اجتماعی و زیست شناخت و درک ما را از این حوزه ها بیشتر کرد. در واقع، امروزه این باور که نحوه توزیع هر توانایی فیزیکی یا فکری باید از منحنی نرمالی تبعیت کند، چنان ریشه مستحکمی یافته است که هر اندازه گیری ای که به این نتیجه گیری منجر نشود مشکوک تلقی می شود. اگر، مثلاً، از دانشجویان زیادی آزمون جدیدی گرفته شود و نمرات توزیع نرمال نداشته باشند، هر نتیجه ای که در مورد توزیع هوش بگیریم مورد تردید واقع نمی شود، بلکه خود آن آزمون بی اعتبار قلمداد می شود.
مطالعات نموداری توزیع ها پرسش های برانگیزاننده ای را باعث گردید. دیدیم که مشخصه های فیزیکی و ذهنی توزیعی نرمال دارند. اما اگر نمودار توزیع درآمدها را ترسیم کنیم- یعنی هر یکی از درآمدهای مختلف در مقابل فرد دارای آن درآمد رسم کنیم- نمودار ما بسیار شبیه شکل 4 خواهد شد. این منحنی می گوید که درآمد بیشتر مردم در انتهای پایینی مقیاس درآمد دیده می شود. تحقیقات حاکی از آن اند که بیشترین درآمد (13) در «نقطه گرگ»(14) یا نقطه « بخور و نمیر» است. این منحنی همچنین نشان می دهد که خیلی از مردم درآمدی بسیار کمتر از درآمد لازم برای تأمین حداقل معاش خود دارند و فقط معدودی از آن ها درآمدی بسیار بیشتر از این مقدار دارند.
شکل 4. توزیع فراوانی درآمد
پس این منحنی بلافاصله تفاوت هولناک در میزان درآمد را نشان می دهد و ما را متوجه نابرابری درآمد از یک طرف، و توانایی های ذهنی و فیزیکی از طرف دیگر می کند. این نابرابری را باید توضیح داد. چرا توزیع درآمد تفاوتی چنین ریشه ای با توزیع توانایی های افرادی دارد که آن درآمدها را کسب می کنند؟
از داده ها یا از نمودارهایی که بر اساس داده ها ترسیم می شوند، نتیجه گیری های با ارزشی به دست می آید که نه تنها در مسائل عملی، بلکه از منظری نظری نیز اهمیت دارند.اما جان مایه هر پژوهش علمی، بنابر استانداردهای معاصر، فرمول های ریاضی است. نتیجه ای که به صورت یک فرمول درآمده باشد، ارزشی مضاعف دارد. فرمول نه تنها به خودی خود نتیجه ای فشرده و با ارزش است، بلکه کاربرد تمام تکنیک های ریاضی جبر، حساب دیفرانسیل و انتگرال و دیگر شاخه ها را برای استنتاج نتایج جدید امکان پذیر می کند. نکته ای که در این جا گفتیم می توان به کمک مضمونی که پیش از این توضیحش داده بودیم درک کرد. مفهوم جاذبه جهانی به خودی خود تعمیمی است که اطلاعات بسیار زیادی در بردارد. ولی از آن جا که می توان رفتار این مفهوم را به شکل یک فرمول بیان کرد، می توان آن را با قوانین حرکت ادغام کرد و مسیر حرکت سیارات را به دور خورشید نتیجه گرفت.
به هر حال، شکی نیست که گاهی می توان داده ها را در یک فرمول خلاصه کرد و وقتی چنین شود، روند کار معنایی پربار خواهد یافت. اکنون می خواهیم روند این کار را تشریح کنیم و به این منظور به مسئله ای توجه می کنیم که تا حدی تخصصی است ولی اندکی آن را ساده کرده ایم.
فرض کنید می خواهیم نوسان قیمت غذا را در عرض یک سال مطالعه کنیم. تراز قیمت غذا، و نیز هر کالای دیگری، با عددی سنجیده می شود که به آن « عدد شاخص» می گویند که نسبتاً قیمتی متوسط است و از طریق روش هایی به دست می آید که در این جا مورد بحث ما نیست. جدول زیر فهرستی از اعداد شاخص قیمت خرده فروشی غذا طی چند سال در ایالات متحده (بر حسب دلار) است (این اعداد را با y نشان داده ایم). در این جدول x نشانه تعداد سال ها پس از سال 1900 است؛ به این ترتیب، 1=x معادل است با 1901 و به همین ترتیب تا آخر.
مشاهده به تنهایی فرمولی در مورد نسبت میان x و y به دست نمی دهد. گام بعدی ترسیم نمودار این زوج مقدارهای x و y در یک محور مختصات است؛ به طوری که مثلاً محور طول ها نماینده مقادیر x و محور عرض ها نماینده مقادیر y باشد. به نظر می رسد نقاط مشخص شده بر یک خط راست واقع می شوند. در واقع، خطی که از نقاطی با مختصات ( 3، 75) و (، 89) می گذرد، بسیار نزدیک به نقاط دیگر است. خطاهای ناگزیر در تعیین این اعداد شاخص می تواند توضیح این واقعیت باشد که چرا این نقاط دیگر دقیقاً بر روی این خط راست واقع نشده اند. تا این جا نشان دادیم که نمودار تابع ما یک خط مستقیم است.
پیدا کردن معادله این خط مسئله ای آسان در هندسه مختصاتی است:
این فرمول خبر از دستاورد مهمی می دهد. می بینیم که بدون آگاهی از عامل های مؤثر در صعود و نزول قیمت غذا، قانونی به دست آورده ایم که مسیر این قیمت را نشان می دهد. این قانون یقیناً سال های میان 1900 تا 1915 را در بر می گیرد و همچون دیگر قوانین علم می توان از آن برای پیش بینی استفاده کرد- که در این مورد تراز قیمت غذا طی مدت زمانی پس از سال 1915 پیش بینی می شود.
وسوسه ای برای ادامه بیشتر این مطلب وجود دارد. آیا این فرمول رفتار واقعی بهای غذا را در همه زمان ها نشان می دهد؟ بی تردید نه. در واقع، سؤالی بنیادی وجود دارد و آن این که آیا بهای غذا اصولاً الگوی غیر قابل تغییری دارد؟ در هر حال، بهای غذا پیوسته بالا نمی رود و از این رو فرمول بالا در بهترین حالت فقط می تواند نماینده تقریبی قانون واقعی و صادق و آن هم فقط در دوره کوتاهی از زمان باشد. این فرمول به دو دلیل نمی تواند اطلاعات بیشتری بدهد؛ یکی به این دلیل که بر اساس حجم محدودی از داده هاست و یکی هم شاید به این دلیل باشد که شاخص بهای غذا چیز چندان اعتماد پذیری نیست.
درست است که شاید این مسئله خاص در مورد تراز بهای غذا به هیچ قانون بنیادی یا جهان شمولی منجر نشود، رهیافت کلی ای که پیش از این از آن صحبت کردیم به چنین قوانینی منجر می شود- البته به شرطی که این قوانین در حوزه مورد بحث وجود داشته باشند؛ این قوانین جایی وجود دارند که داده ها از الگوی ثابتی نتیجه شوند. تکنیک کار عبارت است از ترسیم نمودار داده ها و تطبیق فرمولی متناسب با آن نمودار. همان گونه که می توان حدس زد، این روند، وقتی نمودار به شکل خط راست نیست، احتمالاً محتاج ریاضیات پیچیده و سطح بالایی است.
نمونه مهم تر فرمولی که از بررسی داده ها به دست آید و، در عین حال، قانون اقتصادی مهمی از آب درآمد. توسط ویلفردو پارتو، پژوهنده مشهور اقتصاد سیاسی، مطرح شد. تحقیقات پارتو در مورد توزیع درآمد یک جامعه منجر به ارائه فرمول
خودِ پارتو وجود چنین قانونی در توزیع درآمد را نه به ساختار اقتصادی، بلکه به توزیع عام کیفیت های طبیعت خاصی در انسان نسبت داد. او از ثابت بودن قانونش استفاده کرد تا این عقیده کارل مارکس (15) را که گرایش جامعه سرمایه داری تقلیل درآمد اکثر افراد است، رد کند. او همچنین با توسل به این قانون نشان داد که چرا هیچ کشوری نباید بکوشد تا با وضع قانون نابرابری های درآمد را بهبود بخشد.
اکنون می توانیم همان سوال هایی را که در مورد رفتار بهای غذا پرسیدیم در مورد روش پارتو در بررسی توزیع درآمد نیز بپرسیم: آیا در مورد توزیع درآمد قانونی جهانی وجود دارد؟ و اگر چنین است، آیا فرمول پارتو آن قانون را بیان می کند؟ دلیل دیگری هم داریم که این تصور را که درآمد ها، برخلاف بهای غذا، از چنین قانونی تبعیت می کنند، تصوری معقول جلوه می دهد. می توان پذیرفت که عوامل اصلی ای که بر درآمد تأثیر می گذارند در هر زمان و در هر جامعه ای تقریباً به یک نحو عمل می کنند. بنابر دلایلی « پیشینی»، می توان گفت که حداقل احتمال این وضع همان قدر است که بگوییم سیارات در هر سال مسیری تغییر ناپذیر را طی می کنند.
در میان اقتصاددانان، درستی قانون پارتو بازار مناقشه را سخت گرم نگه داشته است. این قانون نخست به سال 1895 اعلام شد و از آن زمان تاکنون، با توجه به داده های مختلف از کشورهایی مختلف، بارها به آزمون گذاشته شده است. در بسیاری از کشورهایی که این آزمون در آن ها انجام شده، نظیر انگلستان قرن نوزدهم و اوایل قرن بیستم، فرمول پارتو با داده ها انطباق خیلی خوبی داشته است. از طرف دیگر، ناهمخوانی های فرمول با داده ها لزوماً به معنای ابطال فرمول نیست؛ زیرا همیشه اعتماد پذیری داده ها محل تردید است.
واقعیت این است که هرگز نمی توانیم یقین داشته باشیم هر قانونی که از تطبیق یک فرمول با داده ها به دست می آید درست باشد. پس از آن که نمودار اعداد شاخص و زمان را ترسیم کردیم، خط مستقیم را برگزیدیم که از تعداد نقاط بسیاری می گذرد و به نقاط دیگر هم بسیار نزدیک است. اما فقط یک خط راست نیست که از برخی نقاط می گذرد و به دیگر نقاط هم نزدیک می شود. اگر این خط تغییر کند، فرمول آن نیز، که در مرحله بعد از آن نتیجه می شود، تغییر می کند؛ البته، چنین تفاوتی ممکن است از لحاظ مقاصد عملی قابل چشم پوشی باشد، اما این امر را نمی توان از پیش محرز کرد.
دقت فرمول پارتو حتی شاید کمتر از آن چیزی باشد که نکات بالا خبر می دهند. نقاط واقع بر نمودار اعداد شاخص کمابیش روی خط مستقیمی واقع می شوند؛ سپس، « فرض می شود» که این نمودار واقعاً یک خط مستقیم است، و انحراف های آن نسبت به خط مستقیم به خطاهایی نسبت داده می شود که در روند جمع آوری داده ها پیش آمده است. هر چند موقعیت حقیقی چه بسا این باشد که داده ها درست و دقیق باشند، نقاط نه بر یک خط مستقیم، که بر خطی منحنی واقع اند که دقیقاً از همه آن ها می گذرد. اگر چنین باشد، فرمولی که یافته ایم یقیناً درست نیست؛ هر چند شاید از لحاظ مقاصد عملی کار ما را راه بیندازد.
با خطاهایی که در روند تطبیق یک فرمول با داده ها رخنه می کنند چه باید کرد؟ تنها کاری که می توانیم انجام دهیم این است که دیروز و امروز را راهنمای فردا بینگاریم. با استفاده از فرمول به دست آمده، اقدام به پیش بینی می کنیم و پیش بینی های خود را با توجه به آنچه در واقع رخ می دهد می آزماییم. اگر این پیش بینی ها نادرست از کار درآمدند، می توانیم از داده هایی جدید، همراه با داده های قبلی، برای انطباق یک فرمول با مجموعه گسترده تری از داده ها استفاده کنیم. با وجود عدم قطعیت هایی که در تاروپود استخراج فرمول ها از داده ها و نیز در تاروپود پیش بینی هایی که بر اساس این فرمول ها می کنیم وجود دارد، تردیدی نیست که این فرمول ها داده های موجود را به مطلوب ترین شکل ممکن فشرده می کنند و باز می نمایند. علاوه بر این، برخی از فرمول هایی که با داده ها تطبیق یافته اند، چنان کاربرد پذیری استوار و محکمی دارند که گویی به همان اندازه بیان رفتار ثابت طبیعت اند که قوانین حرکت و گرانش نیوتن.
هر چند در برخی مطالعات آماری این برداشت از مفهوم فرمول کاربردی ندارد، در این موارد هم ما همچنان می خواهیم از دل داده های موجود شناخت لازم را به دست آوریم. بهتر است به یکی از مسائلی توجه کنیم که سال ها موضوع تحقیق سر فرانسیس گالتن (16)، از عموزادگان داروین (17) و بانی علم اصلاح نژاد انسان، بود. گالتن به بررسی این مسئله پرداخت که قد غیرعادی وراثتی است یا نه و روشی که به کار گرفت اساساً از این قرار بود: او هزار پدر را در نظر گرفت، قد آن ها را ثبت کرد و سپس قد پسران آن ها را هم اندازه گیری کرد. اگر اصولاً فرمولی در این مورد وجود داشته باشد، باید بتواند بین دو متغیر ارتباط برقرار کند: طول قد پدران و طول قد پسران. از این گذشته، به ازای هر مقدار یک متغیر، فرمول بابد تنها « یک» مقدار برای متغیر دوم داشته باشد. مثلاً، فرمول y=3x به ازای هر یک مقدار از x تنها یک مقدار برای y دارد. در این جا، به ازای هر یک طول قد یک پدر، چند طول قد برای پسران وجود دارد، پس مسئله به دست آوردن فرمول اصولاً نمی توانست مطرح باشد. کاری که گالتن کرد، وارد کردن مفهوم تضایف (18) [هم بستگی] بود. تضایف بین دو متغیر سنجشی است از رابطه بین آن ها. این سنجش یا عدد با جایگزینی مقدارهای فردی متغیرها در عبارتی که به طور خاصی ساخته شده و « ضریب هم بستگی» نامیده می شود، به دست می آید. این عدد می تواند مقدارهای 1- تا 1+ را داشته باشد.
تضایف 1 نشانه نسبتی مستقیم است؛ بدین معنی که اگر یک متغیر زیاد یا کم بشود، دیگری نیز چنین خواهد شد. وقتی یک متغیر زیاد شود متغیر دیگر نیز زیاد خواهد شد و برعکس. تضایف 1- به معنی آن است که یک متغیر عکس متغیر دیگر حمل می کند، به طوری که وقتی مقدار متغیر اول زیاد شود، متغیر دوم کم می شود و برعکس. هم بستگی 0 (صفر) به معنی آن است که رفتار یک متغیر به رفتار متغیر دیگر هیچ ربطی ندارد و دو متغیر مستقل از یکدیگر عمل می کنند. هم بستگی مثلاً
گالتن دریافت که بین قد پدران و قد پسران هم بستگی مثبت معینی وجود دارد. پدران بلند قد، عموماً، پسران بلند قدی دارند. گالتن همچنین پی برد که انحراف قد پسران از میانگین قد نژادی کمتر از اختلاف قد پدران از این میانگین است- یعنی فرزندان پدران بلند قد اصولاً به بلندی پدران خود نیستند و قد آن ها به سمت میانگین قد نژادشان کوتاه می شود. گالتن از مطالعات خود بر روی وراژت هوش نیز به نتایجی مشابهی رسید. به طور متوسط، استعداد امری وراثتی است، اما وضع فرزندان معمولی تر و عادی تر از والدین خود است. این نتیجه را بهتر است والدینی توجه کنند که از کمی استعداد فرزندان خود رنج می برند.
گالتن نیز نظیر کتله از نتایجی که به دست آورده بود سخت به هیجان آمد. پس از آن که پی برد نتایجی که در مورد طول قد و هوش به دست آورده به بسیاری دیگر از مشخصه های انسان نیز اطلاق می شود، نتیجه گرفت که فیزیولوژی انسان ثابت است و تمام جانداران به سمت تیپ یا نوع خود گرایش دارند.
با ارزش ترین جنبه کار گالتن مفهوم تضایف بود. این مفهوم بسیار مفید از کار درآمد. برای آن که تراز تولید صنعتی در کشوری مطالعه شود، باید داده های بسیار پیچیده و تودرتویی به دست آورد. اما اگر تضایف بین تولید صنعتی و تعداد سهامی که در بازار بورس معامله می شود زیاد باشد، به راحتی می توان از داده های مربوط به بازار بورس کمک گرفت. اگر هوش عمومی با توانایی ریاضی تضایف نزدیکی زیادی داشته باشد، می توان انتظار داشت اشخاصی که از هوش خوبی برخوردارند به خوبی از عهده فهم ریاضیات بر می آیند. آگاهی از میزان تضایف بین موفقیت در دبیرستان و موفقیت در دانشگاه، یا موفقیت در دانشگاه و موفقیت مالی در زندگی می تواند در پیش بینی وضع آتی گروه های افراد بسیار باارزش باشد.
ولی هرجا که بنا باشد احتیاط و توجه و نحوه قضاوت، و نه ریاضیات، نقایص را برطرف کند، مشکلاتی در زمینه استفاده از روش های آماری بروز می کند. یکی از این مشکلات معنای اصطلاحاتی است که از آن ها استفاده می شود. فرض کنید می خواهیم بیکاری را در کشوری بررسی کنیم. چه کسانی بیکار به شمار می آیند؟ آیا این اصطلاح شامل کسانی می شود که کاری ندارند اما دوست دارند بیکار باشند؟ یا کسانی که دو روز در هفته کار می کنند اما مایل اند به استخدام تمام وقت درآیند؟ یا مهندسی که تحصیلات عالی ای داشته اما نمی تواند شغلی غیر از رانندگی تاکسی به دست بیاورد؟ یا کسانی که اصلاً به درد کارکردن نمی خورند؟
تفسیر نتایج آمار نیز مشکلاتی دارد. آمار نشان می دهد که هر سال، نسبت به سال قبل، عده بیشتری بر اثر سرطان می میرند. آیا این بدان معناست که زندگی در عصر مدرن احتمال ابتلا به سرطان را بیشتر کرده است؟ بعید است. پنجاه سال پیش هم بسیاری از مردم به دلیل ابتلا به سرطان می مردند. اما علت مرگ آن ها تشخیص داده نمی شد، زیرا تکنیک های پزشکی چون امروز پیشرفته نبود. از این گشته، انسان امروز عمری طولانی تر از انسان پنجاه سال پیش دارد، و چون سرطان بیشتر دامن کهن سالان را می گیرد بیشتر با آن مواجه می شویم. بسیاری از کسانی که سال ها پیش به دلیل ابتلا به سل مردند چه بسا اگر عمر طولانی تری می داشتند، با سرطان از پای در می آمدند. سرانجام آن که امروزه بایگانی حوادث بهتر حفظ می شود. به عبارت دیگر، گرچه ممکن است امروزه سرطان کشنده تر از سابق باشد، نمی توانیم نتیجه بگیریم که این سال ها ابتلا به آن محتمل تر است یا آن که مردم روزگار ما بیشتر در معرض آن اند.
متأسفانه مسئولان آگهی های تجارتی و تبلیغات چی ها برای به کرسی نشاندن دعاوی خود، این جور مشکلات استفاده از آمار را مخفی نگه داشته یا با مهارت تمام بر آن ها سرپوش گذاشته اند. چنین سوء استفاده هایی از آمار بی اعتمادی ناموجهی را برانگیخته است و به القابی خفت آور برای این علم دامن زده است. آماردانان را کسانی توصیف کرده اند که از فرضیه هایی معیوب و نادقیق نتایجی قطعی می گیرند. این کنایه بی تردید آشنا را هم داریم: دروغ داریم و دروغ شاخ دار داریم و آمار.
سوء استفاده هایی که از آمار می شود نباید ما را بدان جا بکشاند که بر کارایی های آن در مطالعاتی چون تغییرات جمعیت، عملکردهای بازار بورس، بیکاری، مقیاس های دستمزد، هزینه زندگی، نرخ تولد و وفات، نسبت مستی به جرم، توزیع مشخصه های فیزیکی و هوش، و بروز بیماری ها چشم بپوشیم. آمار اساس بیمه عمر، سیستم تأمین اجتماعی، معالجات پزشکی، خط مشی های حکومتی، و انبوهی مسائل دیگر است. حتی یک دنده ترین تجارت پیشگان هم برای تعیین مکان بهترین بازارهای خود، برای کنترل فرایندهای تولید، برای آزمون کارایی و تأثیر آگهی هایشان، و نیز برای اندازه گیری میزان سود حاصل از محصولات جدیدشان از آمار استفاده می کنند رهیافت آماری حدس و گمان های بی پایه و اساس و قضاوت های شخصی پر عیب و ایراد را از دور خارج می کند و به جای آن ها نتیجه گیری هایی را قرار می دهد که بسیار مفیدند.
کمترین چیزی که می شود گفت این است که روش های آماری در مسائل فوق العاده گوناگونی موفق بوده است. این روش ها نقشی قاطع در بیرون کشیدن علوم از قلمروهایی واهی و راکد و عقب مانده داشته اند. ایده اندازه گیری امروزه بر تمام فعالیت های تمدن غرب سیطره دارد. مدت ها پیش، پزشک مشهور، دکتر ویلیام اوسلر (19)، تأکید کرد که پزشکی وقتی علم خواهد شد که پزشکان شمردن بیاموزند. به خاطر اهمیت مطالعات آماری بود که آناتول فرانس (20) گفت: عملاً کسی که حساب بلد نیست به حساب نمی آید. نتایج ریاضی ای که از داده های مربوط به سیاستمداران گرفته می شود در واقع مسیر زندگی کشورها را شکل می دهد.
پی نوشت ها :
1- J. Graunt، کارشناس آمار انگلیسی (1620- 1674)
2- Sir W. Petty، اقتصاددان سیاسی انگلیسی و پیشگام در علم آمار تطبیقی (1623- 1687)
3- arithmetical mean
4- median
5- mode
6- standard deviation
7- normal frequency curve
8- bell- shaped curve
9- error curve
10- Lambert A. J. Quetelet، ریاضی دان و منجم بلژیکی (1796- 1874)
11- L. Ghiberti، مجسمه ساز فلورانسی (ح 1378- 1455)
12- determinism
13- modal income
14- wolf- point
15- K. H. Marx، فیلسوف، متفکر، مورخ، اقتصاددان و جامع شناس بزرگ آلمانی (1818- 1883)
16-Sir F. Galton، عالم انگلیسی (1822- 1911)
17- C. R. Darwin، طبیعی دان انگلیسی (1809- 1882)
18- correlation
19- Dr. W. Osler، طبیب کانادایی (1849- 1919)
20- Anatole France، نام مستعار ژاک آناتول تیبو، نویسنده فرانسوی (1844- 1924)
{{Fullname}} {{Creationdate}}
{{Body}}